机器学习-白板推导4.2 线性分类——高斯判别模型
机器学习-白板推导4.2 线性分类——高斯判别模型
1. 高斯判别模型描述
Gaussian Discriminate Analysis——GDA 模型描述。
假定数据集:
数据矩阵为:
这里讨论高斯判别分析解决二分类问题,那么对于数据集, 有。数据集分成+1, -1两部分并增加以下约定:
其中,。
现在用bayes公式来生成模型:
其中,是先验Prior, 是后验Posterior。
2. 高斯判别模型建立
因为是二分类问题,可以假定先验概率符合伯努利分布,.
所以,其表达式为:
我们假设两类别数据都符合高斯分布,其均值不同,但不同变量间的协方差矩阵一样,(其实协方差不一样结论也一样,只是计算复杂)因此有:
后验估计函数为:
为了推导方便,记:
那么上述函数可以表示为:
3. 参数求解
1. 求解
只有跟参数有关,对其求导得:
因为只有类别为中, 式4可以简化成:
2. 求解
因为只跟部分有关, 展开后得:
式6只有后半部分跟有关,剔除前面部分并化简:
因为是的,那么是, 所以 (都是实数)。并且跟无关
进一步简化得:
对求导得:
令式9为0得:
式10最后简化原因:,只有当时,累加才有用,所以
因为对称性,同理可得
3. 求解
跟有关的只有, 即:
同样因为要么0, 要么1,式11可以简化为:
为了简化计算,我们先计算下:
其中, 简化计算。
首先,有下列公式:
式16证明:Gradient of tr(AB)
式13对求导得:
其中是协方差矩阵。
由式18写出式12:
令其为0得两边同乘以得:
可以理解为协方差矩阵等于各自协方差矩阵的加权和。
高斯判别分析总结:
- 首先假设先验 服从伯努利分布和似然 服从高斯分布,利用贝叶斯公式得到条件概率函数。
- 利用极大似然估计求解最大值参数。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 aigonna!
评论